O método utilizado foi a análise de dados exploratória, o que significa que os dados do estabelecimento Farina in Natura, foram analisados de forma a nos dar informações referente aos acontecimentos passados.
O período analisado foi 01 fevereiro de 2022 a 31 de Outubro 2022
A primeira descoberta na análise foi uma divergência nos dados de vendas de itens e faturamento. Após uma análise dos valores, descobrimos que a falta de entrada dos dados causou essa divergência, isso foi observado na venda de croissants, pois o valor de venda era superior ao valor do item pela sua quantidade. O que isso sugere é a falta da informação referente ao recheio do croissant utilizado, comportamento não ideal, já que deixamos de saber quais são realmente as preferências do cliente no que diz respeito aos recheios.
venda 6 data_hora 6 cliente 6 mesa 3219 item 76 produto 6 quantidade 6 valor_unit 6 desconto 6 total_item 6 dtype: int64
'pt_BR.utf-8'
Foi verificada uma diferença de R$ 31.659,20 entre o valor de venda do item e o preço unitário vezes a quantidade.
Observamos na tabela acima que o valor de venda nesses itens vendidos sempre é maior do que o valor unitário do item multiplicado por sua quantidade
Após essa análise inicial, realizamos a conversão dos dados brutos e a posterior limpeza das informações. Algumas variáveis que foram enviadas pelo cliente foram descartadas, pois apresentavam muita falta de dados. Outras, no entanto, foram omitidas por não estarem no escopo da análise.
O número de diferentes itens vendido pela loja é: 212
A média de itens por venda é: 2.79 itens
O número médio de itens vendidos por período do dia é: Período Média 0 manhã 3.05 2 tarde 2.78 1 noite 2.66
<class 'pandas.core.frame.DataFrame'> Int64Index: 23199 entries, 0 to 25997 Data columns (total 19 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 venda 23199 non-null int64 1 data_hora 23199 non-null datetime64[ns] 2 cliente 23199 non-null object 3 mesa 23199 non-null object 4 produto 23199 non-null object 5 quantidade 23199 non-null int64 6 valor_unit 23199 non-null float64 7 desconto 23199 non-null float64 8 total_item 23199 non-null float64 9 horario 23199 non-null object 10 hora 23199 non-null int64 11 minuto 23199 non-null int64 12 hora_minuto 23199 non-null object 13 data 23199 non-null datetime64[ns] 14 hora_do_dia 23199 non-null object 15 dia_da_semana 23199 non-null object 16 tipo_de_dia 23199 non-null object 17 item_count 23199 non-null int64 18 mes 23199 non-null int64 dtypes: datetime64[ns](2), float64(3), int64(6), object(8) memory usage: 3.5+ MB
Observamos no gráfico dois pontos que chamam atenção, como destacados no próprio gráfico. Por isso iremos realizar uma análise mais minuciosa.
Para termos uma noção de como o gráfico das vendas se apresentam, excluindo-se esses pontos destacados, segue o gráfico abaixo:
Observamos um pico nas vendas no período entre as 16 e 17 horas, o que nos leva a crer que foram lançadas vendas de diversos períodos no sistema, não apenas as vendas que pertencem ao período. Essa prática leva a distorções na análise das vendas, pois não podemos realmente mensurar de quanto foram as vendas de tais itens em seu tempo de realização, temos então que excluir as vendas de tal período para prosseguirmos nossa análise.
O menor número de vendas em um dia de semana foi: 1 O maior número de vendas em um dia de semana foi: 241 O número médio de vendas em um dia de semana é: 75.81
O menor número de vendas em um dia de fim-de-semana foi: 65 O maior número de vendas em um dia fim-de-semana foi: 227 O número médio de vendas em um dia fim-de-semana é: 133.74
O número médio de itens vendidos por tipo de dia da semana é: Tipo de dia Média 1 FDS 2.84 0 DDS 2.65
| horario | item_count | |
|---|---|---|
| 103 | 2022-05-18 | 241 |
| 99 | 2022-05-14 | 227 |
| 187 | 2022-08-28 | 226 |
| 106 | 2022-05-21 | 226 |
| 242 | 2022-10-23 | 224 |
| 100 | 2022-05-15 | 215 |
| 207 | 2022-09-17 | 197 |
| 200 | 2022-09-10 | 190 |
| 11 | 2022-02-13 | 186 |
| 180 | 2022-08-21 | 183 |
| 29 | 2022-03-05 | 176 |
| 107 | 2022-05-22 | 175 |
| 235 | 2022-10-16 | 172 |
| 173 | 2022-08-14 | 172 |
| 113 | 2022-05-28 | 169 |
O gráfico abaixo representa um ranking das vendas por dia.
Utilizando-se um algoritmo podemos inferir que as vendas podem ser dividias em quartis e que o Farina in Natura apresenta a seguinte distribuição:
as 25% finais do Ranking são dias que tem vendas até 62,25 de itens vendidos, os 50% inferiores do ranking tem dias que vendem até 84 itens, sendo esse valor também a mediana, os 75% dos da parte de baixo do ranking vendem até 114 itens, e os 25% do topo dos dias temos vendas de até 190 itens.
Valores acima desses são considerados outliers, ou fora da curva.
A seguir temos um gráfico de distribuição das vendas por hora do dia, que segue a seguinte lógica, 25% das primeiras vendas se dá das 6 às 11 da manhã, os próximos 25% das vendas acontece entre 11 e 16 horas, o terceiro quarto das vendas ocorre entre as 16 e 18 horas, e os últimos 25% das vendas do dia se dá das 18 as 21 horas.
Com base nos números de vendas fornecidos, pode-se concluir que as horas de pico para vendas ocorrem entre as 16h e as 20h, com o horário mais lucrativo das 17h às 18h, com um percentual de vendas de 14,3%.
Os horários de pico anteriores são das 15h às 16h, com 5,38% de vendas, seguidos das 19h às 20h, com 10,41% de vendas. A segunda hora mais lucrativa é das 18h às 19h, com 12,57% de vendas.
Os horários de vendas mais baixos ocorrem entre as 6h e as 8h, com menos de 3% de vendas durante esses horários. O horário menos lucrativo é das 21h às 22h, com apenas 1,14% de vendas.
Portanto, se o objetivo é maximizar as vendas, seria aconselhável para a empresa aumentar seus recursos (produtos e funcionários) durante os horários de pico, especialmente das 16h às 20h. Além disso, a empresa pode considerar reduzir as horas de operação durante os horários de menor venda(das 06 as 8 horas e depois das vinte uma horas), ou ajustar a oferta de produtos e serviços de acordo com a demanda.
Vemos uma clara diferenciação entre o final de semana e os dias da semana: durante a semana, quase os dobros da venda a noite em relação a manhã e tarde. No sábado vemos um aumento significativo das vendas, principalmente pela manhã, que chega bem perto do período noturno. Já no Domingo há uma inversão completa, o período da manhã é o que apresenta a maior quantidade de vendas, apesar de termos um acréscimo do período da noite em relação aos dias de semana.
Para finalizarmos nossa análise, utilizaremos o algoritmo Apriori.
Rule: ADICIONAL DE PRESUNTO -> ADICIONAL DE MUSSARELA Support: 0.0061068702290076335 Confidence: 0.5416666666666666 Lift: 70.95833333333333 ===================================== Rule: CROISSANT -> ADICIONAL DE MUSSARELA Support: 0.009395184967704051 Confidence: 0.8333333333333333 Lift: 4.038607474862455 ===================================== Rule: ADICIONAL DE PRESUNTO -> CROISSANT Support: 0.006928948913681738 Confidence: 0.9076923076923077 Lift: 4.398975526465566 ===================================== Rule: AGUA MINERAL S/GAS 500ML -> CROISSANT Support: 0.01996476805637111 Confidence: 0.4197530864197531 Lift: 2.0342615428936814 ===================================== Rule: BOWL DE IOGURTE FRUTAS AVEIA -> PAO SOURDOUGH OVOS Support: 0.007868467410452143 Confidence: 0.24814814814814815 Lift: 9.107678799489145 ===================================== Rule: CAFE CATUAI VERMELHO C/LEITE G -> CROISSANT Support: 0.007868467410452143 Confidence: 0.43506493506493504 Lift: 2.1084677985645546 ===================================== Rule: CAFE CATUAI VERMELHO G 200ML -> CROISSANT Support: 0.013740458015267175 Confidence: 0.46799999999999997 Lift: 2.2680819578827545 ===================================== Rule: CAFE COLMEIA C/ LEITE G 200ML -> CROISSANT Support: 0.00551967116852613 Confidence: 0.5280898876404494 Lift: 2.5592973211487915 ===================================== Rule: CROISSANT -> CAFE COLMEIA G 200ML Support: 0.007633587786259542 Confidence: 0.4276315789473684 Lift: 2.0724433094688917 ===================================== Rule: LARANJA 400 ML -> CROISSANT Support: 0.021374045801526718 Confidence: 0.6275862068965518 Lift: 3.041489215551587 ===================================== Rule: SUCO DE LARANJA 400ML -> CROISSANT BRIE PARMA MEL DE Support: 0.005989430416911333 Confidence: 0.2451923076923077 Lift: 5.394864341085272 ===================================== Rule: CROISSANT IFOOD -> PASTEL DE NATA 60G IFOOD Support: 0.005167351732237228 Confidence: 0.4356435643564356 Lift: 9.391151773405188 ===================================== Rule: MINI CROISSANT PAIN DE CHOC -> MINI CROISSANT 25G KIT C 5 Support: 0.00540223135642983 Confidence: 0.2358974358974359 Lift: 5.046901172529314 ===================================== Rule: ADICIONAL DE PRESUNTO -> CROISSANT Support: 0.005637110980622431 Confidence: 0.5 Lift: 72.16101694915254 =====================================
Rule: ADICIONAL DE PRESUNTO -> ADICIONAL DE MUSSARELA Support: 0.009764758100310697 Confidence: 0.5945945945945946 Lift: 40.5945945945946 ===================================== Rule: AGUA MINERAL S/GAS 500ML -> ADICIONAL DE MUSSARELA Support: 0.005326231691078562 Confidence: 0.3243243243243244 Lift: 5.294947121034079 ===================================== Rule: CROISSANT -> ADICIONAL DE MUSSARELA Support: 0.015090989791389259 Confidence: 0.918918918918919 Lift: 3.344627341396324 ===================================== Rule: ADICIONAL DE PRESUNTO -> CROISSANT Support: 0.013315579227696404 Confidence: 0.9090909090909091 Lift: 3.3088559259803203 ===================================== Rule: CROISSANT BRIE PARMA MEL DE -> AGUA MINERAL SEM GAS 500 ML Support: 0.007545494895694629 Confidence: 0.2 Lift: 5.006666666666667 ===================================== Rule: BOWL DE IOGURTE FRUTAS AVEIA -> PAO SOURDOUGH OVOS Support: 0.024411895250776743 Confidence: 0.2972972972972973 Lift: 3.9170222854433385 ===================================== Rule: BOWL DE IOGURTE FRUTAS AVEIA -> SELECAO DE PAES GELEIA Support: 0.010208610741233911 Confidence: 0.2674418604651163 Lift: 3.2570081709616594 ===================================== Rule: LARANJA 400 ML -> CAFE CATUAI VERMELHO C/LEITE G Support: 0.007989347536617843 Confidence: 0.23684210526315788 Lift: 3.629967776584318 ===================================== Rule: CROISSANT IFOOD -> COOKIES 80G IFOOD Support: 0.005770084332001775 Confidence: 0.619047619047619 Lift: 7.621389539422324 ===================================== Rule: CROISSANT BRIE PARMA MEL DE -> CROISSANT OVOS BACON MEL Support: 0.007989347536617843 Confidence: 0.2 Lift: 4.506 ===================================== Rule: SUCO DE LARANJA 400ML -> CROISSANT BRIE PARMA MEL DE Support: 0.00887705281846427 Confidence: 0.22222222222222224 Lift: 6.032128514056224 ===================================== Rule: CROISSANT IFOOD -> PASTEL DE NATA 60G IFOOD Support: 0.008433200177541057 Confidence: 0.5428571428571428 Lift: 6.683372365339578 ===================================== Rule: CROISSANT IFOOD -> SOURDOUGH 369G IFOOD Support: 0.008433200177541057 Confidence: 0.59375 Lift: 7.309938524590163 ===================================== Rule: CROISSANT MUSSATRELA DE -> SUCO DE LARANJA 400ML Support: 0.006657789613848202 Confidence: 0.2459016393442623 Lift: 6.674896306537625 ===================================== Rule: SUCO DE LARANJA 400ML -> CROISSANT OVOS BACON MEL Support: 0.008433200177541057 Confidence: 0.2289156626506024 Lift: 5.157469879518072 ===================================== Rule: MINI CROISSANT PAIN DE CHOC -> MINI CROISSANT 25G KIT C 5 Support: 0.007101642254771416 Confidence: 0.2857142857142857 Lift: 5.646616541353383 ===================================== Rule: ADICIONAL DE PRESUNTO -> CROISSANT Support: 0.009320905459387484 Confidence: 0.5675675675675677 Lift: 42.624324324324334 ===================================== Rule: AGUA MINERAL S/GAS 500ML -> CROISSANT Support: 0.006657789613848202 Confidence: 0.2054794520547945 Lift: 3.354675402025015 ===================================== Rule: LARANJA 400 ML -> BOWL DE IOGURTE FRUTAS AVEIA Support: 0.006213936972924989 Confidence: 0.29166666666666663 Lift: 4.470238095238095 ===================================== Rule: LARANJA 400 ML -> CAFE CATUAI VERMELHO G 200ML Support: 0.006657789613848202 Confidence: 0.2054794520547945 Lift: 3.149287112105116 ===================================== Rule: PAO SOURDOUGH OVOS -> CAFE CATUAI VERMELHO G 200ML Support: 0.005326231691078562 Confidence: 0.3076923076923077 Lift: 5.590570719602978 ===================================== Rule: LARANJA 400 ML -> PAO SOURDOUGH OVOS Support: 0.005326231691078562 Confidence: 0.3076923076923077 Lift: 4.71585557299843 ===================================== Rule: SANDUICHE DE PEPERONI BRIE -> PASTEL DE NATA 60G Support: 0.006213936972924989 Confidence: 0.3783783783783784 Lift: 3.1928332827209234 =====================================
Queremos aumentar o número de itens vendidos de uma maneira que incentive itens que, caso contrário, não seriam comprados. Devemos levar em conta as variáveis que sabemos que alteram a forma como os clientes interagem conosco (ou seja, hora do dia e dia da semana). O resultado final deve fornecer uma direção clara sobre como agir, por que esse curso de ação é desejável e não deve ser muito confuso para o cliente nem muito complexo para um operador.
A compra de qual item leva à compra de quais outros itens? O algoritmo “Apriori” é capaz de responder isso.
O algoritmo “Apriori” nos ajudará a fazer a combinação de itens a serem vendidos em conjunto. Utilizamos a métrica do SUPORTE para acharmos os itens que são mais vendidos. O SUPORTE é calculado dividindo a quantidade de itens vendidos de um determinado produto pela quantidade de todos os itens vendidos. Por exemplo no caso da Farina In Natura, o item que possui o maior SUPORTE é o croissant(0,2063). O algoritmo fara uma combinação dos itens que tem maior SUPORTE com os de menor SUPORTE. Para isso utilizará as métrica da CONFIANÇA e INCREMENTO.
A CONFIANÇA nos dá a probabilidade de o consequente estar presente em uma transação, dado que o antecedente já está presente. Os valores de confiança variam entre 0 e 1. Um valor de confiança próximo a 1 sugere uma forte relação entre antecedente e consequente, enquanto um valor próximo a 0 indica uma relação fraca.
A métrica INCREMENTO é uma medida usada para avaliar a qualidade das regras de associação geradas pelo algoritmo “Apriori”. Ela ajuda a determinar se a relação entre o antecedente e o consequente em uma regra Antecedente->Consequente é significativa ou se ocorre apenas por acaso. Métricas de INCREMENTO maior que 1, nos dizem que antecedentes e consequentes ocorrem juntos mais frequentemente do que esperaríamos se fossem estatisticamente independentes. Ou seja quanto maior o valor do INCREMENTO maior a dependência deles
Na tabela abaixo vemos combinações de itens propostas pelo algoritmo com base nessas métricas e na ordem de decrescente da métrica Incremento.
Esta tabela apresenta regras de associação geradas a partir dos dados de fornecidos pela gerência da Farina. Cada linha representa uma regra de associação entre um antecedente (produto comprado) e um consequente (produto também comprado). A tabela fornece informações sobre suporte do antecedente (proporção de transações contendo o antecedente), suporte do consequente (proporção de transações contendo o consequente), SUPORTE (proporção de transações contendo tanto o antecedente quanto o consequente), CONFIANÇA (probabilidade condicional do consequente dado o antecedente), INCREMENTO (razão do suporte observado para o suporte esperado se antecedente e consequente forem independentes).
Por exemplo, a primeira linha mostra que o antecedente é CROISSANT e o consequente é COCA COLA LATA 350 ML. O suporte do antecedente é 0,206342, o que significa que 20,63% das transações incluem um croissant. O suporte do consequente é 0,036524, o que significa que 3,65% das transações incluem uma lata de 350 ml de Coca Cola. O suporte é 0,009982, o que significa que 0,998% das transações incluem tanto um croissant quanto uma lata de 350 ml de Coca Cola. A confiança é 0,048378, o que significa que há 4,84% de chance de um cliente comprar uma lata de 350 ml de Coca Cola dado que comprou um croissant. O INCREMENTO é 1,324559, indicando que a probabilidade de comprar um croissant e uma lata de 350 ml de Coca Cola juntos é 32,46% maior do que se os dois produtos fossem comprados independentemente.
Podemos utilizar as métricas para fazermos as nossas próprias combinações de acordo com o item que queremos aumentar o nível de vendas. Por exemplo, um item que tenha ainda um suporte baixo mas que tenha uma margem de lucro maior.
As seguintes associações podem ser ofertadas:
CROISSANT - ADICIONAL DE PRESUNTO | 0.007634 CROISSANT - CAFE COLMEIA C/ LEITE G 200ML | 0.010452 CROISSANT - ADICIONAL DE MUSSARELA | 0.011274 PASTEL DE NATA 60G - AGUA MINERAL C/GAS 500ML | 0.023605 PASTEL DE NATA 60G - QUICHE DE TOMATE SECO SALADA | 0.025484
Com base nessas descobertas e sugestões, os gestores do estabelecimento Farina in Natura podem tomar decisões informadas e eficientes para melhorar suas operações, aumentar as vendas e a satisfação dos clientes.